如上節所述,處理交易過程細節繁多,且一個企業中可能就有數十種不同的交易處理系統,如:
等視各產業及功能的不同,用來管理各種線上交易(online transaction processing, OLTP)的系統,各系統間彼此功能迥異而複雜,因此各系統通常為獨立且有專門團隊來運行,以確保日常業務交易可被正常處理。
而何謂資料分析需求呢?其特性又為何?
當企業收集了大量的業務資料,管理者自然會希望能從自家資料 (data) 中去蕪存菁,得到對決策有幫助的資訊 (information),如以下:
等各類對運營狀況的查詢,這類使用資料庫的模式則被稱為線上分析處理 (online analytic processing, OLAP),DDIA 對兩者差異的描述如下:
可以看到兩類系統的讀寫模式迥異:
這樣需對資料庫掃描 大量紀錄 的操作,會對資料庫效能會有顯著影響,一般不太可能犧牲交易系統之效能給急迫性相對低的分析需求使用 (畢竟分析報告不做不會怎樣,日常交易弄不好可是會引起客訴的)。
為了解決分析人員沒做完報表還是會被老闆罵的問題,資料倉儲(Data warehouse) 應運而生:
前點所述將資料存入倉庫的過程稱為 ETL (Extract, Transform, Load),如下圖 :
系列文明日《資料倉儲的不足?》將接續本日內容,闡述資料倉儲雖好,但也不是萬能,那麼到底有哪些可以被改進的不足之處呢?
My Linkedin: https://www.linkedin.com/in/benny0624/
My Medium: https://hndsmhsu.medium.com/